Un critère d'évaluation Bayésienne pour la construction d'arbre de décision
نویسندگان
چکیده
Résumé. Nous présentons dans cet article un nouvel algorithme automatique pour l’apprentissage d’arbres de décision. Nous abordons le problème selon une approche Bayésienne en proposant, sans aucun paramètre, une expression analytique de la probabilité d’un arbre connaissant les données. Nous transformons le problème de construction de l’arbre en un problème d’optimisation : nous recherchons dans l’espace des arbres de décision, l’arbre optimum au sens du critère Bayésien ainsi défini, c’est à dire l’arbre maximum a posteriori (MAP). L’optimisation est effectuée en exploitant une heuristique de pré-élagage. Des expérimentations comparatives sur trente bases de l’UCI montrent que notre méthode obtient des performances prédictives proches de celles de l’état de l’art tout en étant beaucoup moins complexes.
منابع مشابه
Un Critère d'Évaluation pour la Construction de Variables à base d'Itemsets pour l'Apprentissage Supervisé Multi-Tables
Résumé. Dans le contexte de la fouille de données multi-tables, les données sont représentées sous un format relationnel dans lequel les individus de la table cible sont potentiellement liés à plusieurs enregistrements dans des tables secondaires en relation un-à-plusieurs. Dans cet article, nous proposons un Framework basé sur des itemsets pour la construction de variables à partir des tables ...
متن کاملSélection d’a priori et géométrie de l’information
Dans cette contribution, nous étudions le problème de la sélection de distribution a priori dans le contexte de la théorie bayésienne. La litérature sur le sujet est abondante et le problème est loin d’être définitivement résolu [1]. Nous revisitons cette problématique avec les outils de la géométrie différentielle pour proposer une construction de l’a priori dans le cadre de la théorie bayésie...
متن کاملUn critère d'évaluation pour la sélection de variables
Résumé. Cet article aborde le problème de la sélection de variables dans le cadre de la classification supervisée. Les méthodes de sélection reposent sur un algorithme de recherche et un critère d’évaluation pour mesurer la pertinence des sous-ensembles potentiels de variables. Nous présentons un nouveau critère d’évaluation fondé sur une mesure d’ambigüıté. Cette mesure est fondée sur une comb...
متن کاملUn critère Bayésien pour évaluer la robustesse des règles de classification
Résumé. L’utilisation de règles de classification dans les modèles prédictifs a été très étudiée ces dernières années. La forme simple et interprétable des règles en font des motifs très populaires. Les classifieurs combinant des règles de classification intéressantes (selon une mesure d’intérêt) offrent de bonnes performances de prédictions. Cependant, les performances de ces classifieurs dépe...
متن کاملConstruction auto-stabilisante d'arbre couvrant en dépit d'actions malicieuses
Un protocole auto-stabilisant est par nature tolérant aux fautes transitoires (i.e. de durée finie). Ces dernières années ont vu apparaı̂tre une nouvelle classe de protocoles qui, en plus d’être auto-stabilisants, tolèrent un nombre limité de fautes permanentes. Dans cet article, nous nous intéressons aux protocoles auto-stabilisants tolérant des fautes permanentes très sévères : les fautes byza...
متن کامل